打开APP

拥抱AI,颜宁团队连发两篇论文,开发“酷寻”策略,探寻未知新蛋白,开启结构生物学新范式

  1. 蛋白三维结构

来源:生物世界 2024-12-21 10:04

该研究揭示了聚糖在糖缀合物结构折叠中的关键作用,并有助于理解生物圈中的碳/氮比值。

冷冻电镜(cryo-EM)技术带来了分辨率革命,让我们能够以原子级的高分辨率观察并描绘蛋白质结构。基于人工智能(AI)的AlphaFold等工具实现了对蛋白质结构的快速且精准的预测,如今,AlphaFold已经预测了地球上几乎所有已知的蛋白质的结构。

从历史上来看,结构生物学(Structural Biology)一直专注于研究已知物质。而现在,结构生物学正经历着一种范式转变——从靶向结构确定到结构引导的发现先前未被表征的生物实体。而冷冻电镜的高分辨率能力以及人工智能的结构预测能力,为探索完全未知的生物实体提供了前所未有的机会。

最近,深圳医学科学院颜宁教授团队接连发表了两篇论文,提出了一个名为CryoSeek(酷寻)的新策略,将冷冻电镜作为一种观察工具,结合AI辅助的自动建模和生物信息学分析,发现自然界中完全未知的新型生物实体。

2024年10月9日,颜宁、李张强等人在《美国国家科学院院刊》(PNAS)发表了题为:CryoSeek: A strategy for bioentity discovery using cryoelectron microscopy 的研究论文【1】。

CryoSeek的工作流程包括以下几个步骤:

1)从自然来源收集样本;

2)用过滤、浓缩等简单程序处理样品;

3a)执行标准冷冻样品制备和冷冻电镜数据采集,或3b)通过其他方法(例如宏基因组测序和质谱分析)来表征样品;

4)冷冻电镜数据处理;

5)AI辅助自动建模;

6)结合步骤3b的其他生物信息学分析结果,根据其结构识别相应的生物实体。

首先,颜宁团队使用冷冻电镜(cryo-EM)对清华荷塘的滤过水样进行观察分析,发现了丰富多样的生物大分子,其中长短、粗细不一的纤维状结构在占据主导地位。然后,颜宁团队通过三维重构获得了多个纤维结构的高分辨率电镜密度图。

接下来,利用清华大学张强锋团队开发的基于AI算法的CryoNet软件进行自动模型搭建,获得了两种高度相似的螺旋纤维蛋白的三维结构,颜宁团队将其命名为TLP-1a和TLP-1b,每一种直径约为8 nm。

进一步的生物信息学分析显示,TLP-1a和TLP-1b这两种纤维状蛋白具有独特的形状和厚度,来自完全未知的物种。研究团队认为,其很可能是某种细菌用于物质传递和辅助运动的菌毛。

总的来说,这项研究展示了结构生物学的范式转变,之前的结构生物学总是应用于已知的物质,而现在,在蛋白质序列和来源完全未知的情况下,完全基于高分辨率的结构测定实现了对未知生物实体的物质鉴定和功能预测,使结构生物学成为探索完全未知物质的驱动力。

此外,该研究提出的CryoSeek策略还可以扩展到识别来自河流、海洋、雨滴的生物实体,甚至来自深海、热液喷口甚至太空等极端环境的生物实体,从而有助于将结构生物学扩展到结构X学(Structural X-ology),例如结构病理学(Structural pathology)、结构生态学(Structural ecology)、结构考古学(Structural archeology)等。

2024年12月15日,颜宁、李张强等在预印本平台 bioRxiv 发表了题为:The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek 的研究论文【2】。

颜宁团队之前开发了一种名为CryoSeek(酷寻)的研究策略——使用冷冻电镜(cryo-EM)从自然或内源性资源中识别未表征的全新生物实体。

在这项新研究中,研究团队发现了一种高度糖基化的蛋白纤维——TLP-4b,其主要分子质量归因于一个厚聚糖壳。由于多个AI辅助软件都无法自动搭建出其蛋白结构,研究团队进行了人工手动搭建,确定了其结构,3.3 Å分辨率的冷冻电镜结构重建揭示了该糖蛋白纤维的唯一蛋白质成分——直径约为8 nm的四肽重复线性多肽链。每个四肽重复序列包含1个保守的3,4-二羟脯氨酸(diHyp)、1个丝氨酸或苏氨酸,以及2个较少保守的氨基酸残基组成。其中,3,4-二羟脯氨酸的3-OH与4-OH均高度O-糖基化,丝氨酸或苏氨酸同样存在O-糖基化。

在三维重构区段中,该纤维结构高度规则,其折叠形式完全由糖质间的相互作用维持,并且由于高重复性,这些糖质的组装也是高度有序的。通过计算氨基酸和糖质的比例发现,该纤维结构中糖质的质量占比达到了惊人的95%以上。

总的来说,该研究揭示了聚糖在糖缀合物结构折叠中的关键作用,并有助于理解生物圈中的碳/氮比值。该研究也进一步证明了CryoSeek(酷寻)在发现完全未知的生物实体方面的能力,有望成为推动一系列新研究的起点。

论文链接:

1. https://www.pnas.org/doi/10.1073/pnas.2417046121

2. https://www.biorxiv.org/content/10.1101/2024.12.15.627649v1

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->